Prétraitement des bases de données de réactions chimiques pour la fouille de schémas de réactions
نویسندگان
چکیده
Résumé. Un grand nombre de réactions chimiques sont aujourd’hui répertoriées dans des bases de données. Les chimistes aimeraient pouvoir fouiller les graphes moléculaires contenus dans ces données pour en extraire des schémas de réactions fréquents. Deux obstacles s’opposent à cela : d’une part la manière dont les chimistes représentent les réactions par des graphes ne permet pas aux techniques de fouille de graphes d’extraire les schémas de réactions fréquents. D’autre part les bases de données contiennent des descriptions de réactions souvent incomplètes, ambiguës ou erronées. Le présent article décrit un processus de prétraitement opérationnel qui permet de filtrer, compléter puis transformer le contenu d’une base de réactions en des données fiables constituées de graphes abstraits répondant au problème de la fouille de schémas de réactions. Le processus place ainsi les bases de réactions à portée des techniques de fouille de graphes comme en attestent les résultats expérimentaux.
منابع مشابه
La fouille de graphes dans les bases de données réactionnelles au service de la synthèse en chimie organique
Résumé. La synthèse en chimie organique consiste à concevoir de nouvelles molécules à partir de réactifs et de réactions. Les experts de la synthèse s’appuient sur de très grandes bases de données de réactions qu’ils consultent à travers des procédures d’interrogation standard. Un processus de découverte de nouvelles réactions leur permettrait de mettre au point de nouveaux procédés de synthèse...
متن کاملValeur pratique comparée des réactions d'agglutination, de conglutination directe, d'hémagglutination polyosidique et protéinique pour le diagnostic de la peste
متن کامل
Prétraitement de grands ensembles de données pour la fouille visuelle
Résumé. Nous présentons une nouvelle approche pour le traitement des ensembles de données de très grande taille en fouille visuelle de données. Les limites de l’approche visuelle concernant le nombre d’individus et le nombre de dimensions sont connues de tous. Pour pouvoir traiter des ensembles de données de grande taille, une solution possible est d’effectuer un prétraitement de l’ensemble de ...
متن کاملPrétraitement Supervisé des Variables Numériques pour la Fouille de Données Multi-Tables
Résumé. Le prétraitement des variables numériques dans le contexte de la fouille de données multi-tables diffère de celui des données classiques individuvariable. La difficulté vient principalement des relations un-à-plusieurs où les individus de la table cible sont potentiellement associés à plusieurs enregistrements dans des tables secondaires. Dans cet article, nous décrivons une méthode de ...
متن کاملRecherche de sous-structures fréquentes pour l'intégration de schémas XML
Résumé. La recherche d’un schéma médiateur à partir d’un ensemble de schémas XML est une problématique actuelle où les résultats de recherche issus de la fouille de données arborescentes peuvent être adoptés. Dans ce contexte, plusieurs propositions ont été réalisées mais les méthodes de représentation des arborescences sont souvent trop coûteuses pour permettre un véritable passage à l’échelle...
متن کامل